IA para diagnosticar defeitos congênitos: sistema analisa 18 Mil casos e eleva precisão na busca por mutações genéticas
Plataforma desenvolvida na Universidade de Zhejiang combina inteligência artificial, bancos de dados genômicos e raciocínio assistido por grandes modelos de linguagem para acelerar diagnósticos de doenças congênitas raras

Imagem: Reprodução
Os defeitos congênitos afetam cerca de 6% dos recém-nascidos em todo o mundo e figuram entre as principais causas de mortalidade neonatal, incapacidades permanentes e perdas fetais. Apesar dos avanços do sequenciamento genético, identificar qual mutação específica está causando uma doença continua sendo um dos maiores desafios da medicina genômica. Agora, um estudo liderado por pesquisadores da Universidade de Zhejiang, na China, apresenta uma nova abordagem baseada em inteligência artificial que promete reduzir significativamente esse gargalo diagnóstico.
Batizada de DeepBD (Deep Birth Defects), a plataforma utiliza uma combinação de aprendizado de máquina, modelos de linguagem de grande escala (LLMs), bancos de dados biomédicos e análise estrutural de proteínas para priorizar variantes genéticas potencialmente causadoras de defeitos congênitos. O trabalho foi conduzido por Shiyu Li, Ziqi Yan, Zhihao Wu, Jielong Lu, Weiran Liao, Jiajun Yu, Genjie Li, Zeyu Chu, Jiajun Bu e pelo pesquisador responsável Haishuai Wang, todos vinculados ao Colégio de Ciência e Tecnologia da Computação da Universidade de Zhejiang.
Segundo os autores, o objetivo não é substituir geneticistas clínicos, mas fornecer uma ferramenta capaz de organizar enormes volumes de evidências biológicas e destacar rapidamente as variantes mais prováveis de causar uma doença.
“A interpretação pós-sequenciamento permanece um dos principais gargalos da genética clínica”, afirmam os pesquisadores no estudo.
Um desafio crescente
Nas últimas duas décadas, o custo do sequenciamento genético caiu drasticamente. Hoje, exames como sequenciamento de exoma e genoma completo conseguem identificar milhares de variantes em um único paciente. O problema é que apenas uma pequena fração delas tem relevância clínica.
Em casos de defeitos congênitos, a situação é ainda mais complexa. Muitas vezes os sinais clínicos são detectados durante a gestação por ultrassonografia ou ressonância magnética fetal. Como o desenvolvimento do bebê ainda está em andamento, diversas manifestações da doença podem não estar visíveis naquele momento.
Isso significa que médicos precisam interpretar dados incompletos, conciliando informações genéticas, características clínicas, bancos de dados de doenças raras, predições computacionais e literatura científica.
Foi para enfrentar esse problema que o DeepBD foi desenvolvido.
Treinado com mais de 18 mil casos reais
O diferencial do sistema está na dimensão da base de treinamento. Os pesquisadores utilizaram uma coorte própria composta por 18.622 casos fetais e infantis, contendo dados de sequenciamento genético e perfis clínicos detalhados.
Entre os casos estavam malformações cardíacas, anomalias esqueléticas, alterações do sistema nervoso central, síndromes genéticas, problemas renais e restrição de crescimento fetal.
Para avaliação do desempenho, os autores utilizaram um conjunto independente de 549 pacientes, contendo 1.307 variantes genéticas previamente confirmadas como causais.
A arquitetura do DeepBD foi construída em quatro camadas:
1. Estruturação automatizada do caso clínico por IA;
2. Motor principal de evidências treinado em dados genômicos;
3. Módulos especializados para refinamento das análises;
4. Agente diagnóstico capaz de sintetizar evidências e gerar relatórios interpretáveis.
Resultados superiores aos métodos atuais
Os números apresentados pelos pesquisadores são expressivos.
No teste principal, o DeepBD alcançou:
- Recall@1: 65,8%
- Recall@3: 88,2%
- Recall@5: 91,2%
- Recall@10: 92,9%
Na prática, isso significa que em quase dois terços dos casos a variante genética correta apareceu já na primeira posição do ranking produzido pela IA.
Ferramentas amplamente utilizadas atualmente, como o Exomiser, obtiveram Recall@1 de apenas 49,0% e Recall@10 de 75,1%. Já modelos de linguagem genéricos usados como reranqueadores apresentaram desempenho ainda menor, com taxas de acerto na primeira posição variando entre 38,7% e 44,4%.
Os pesquisadores destacam que o ganho não decorre apenas do uso de inteligência artificial, mas da integração simultânea de múltiplas fontes de evidência.
Como a IA chega ao diagnóstico
O DeepBD combina três categorias principais de informação.
A primeira é composta por evidências clínicas tradicionais, como frequência populacional da variante, registros em bancos como ClinVar e HGMD, validade gene-doença e critérios ACMG para classificação de variantes.
A segunda reúne informações intrínsecas da mutação, incluindo preditores modernos de impacto funcional como REVEL, SpliceAI, PrimateAI e AlphaMissense.
A terceira dimensão utiliza grafos biológicos para conectar sintomas observados no paciente com genes, vias metabólicas, tecidos e tipos celulares associados à doença.
Posteriormente, o sistema ainda pode recorrer a ferramentas estruturais derivadas do AlphaFold, capazes de prever alterações na estrutura tridimensional das proteínas provocadas pelas mutações.
Evidências complementares fazem diferença
Os pesquisadores realizaram experimentos para entender quais componentes mais contribuíam para o desempenho do sistema.

Quando as evidências clínicas tradicionais foram removidas, o Recall@1 caiu de 65,8% para 47,4%. A retirada das informações biológicas baseadas em grafos reduziu o índice para 49,4%, enquanto a exclusão das análises estruturais diminuiu o desempenho para 52,1%.
Esses resultados demonstram que nenhuma fonte de informação é suficiente sozinha.
“O sistema depende de múltiplos níveis de evidência”, observam os autores.
Outro dado relevante é que o DeepBD conseguiu identificar 117 casos adicionais que não haviam sido corretamente priorizados nem pelo Exomiser nem pelo sistema DeepRare, um dos mais avançados modelos agentivos para doenças raras.
Impacto potencial na medicina fetal
Embora ainda necessite de validação em hospitais independentes e populações geneticamente diversas, o estudo aponta para uma nova geração de sistemas de apoio à decisão clínica.
Ao contrário de chatbots médicos que tentam produzir diagnósticos diretamente a partir de linguagem natural, o DeepBD adota uma estratégia mais conservadora e auditável. A IA organiza evidências, classifica variantes e fornece justificativas rastreáveis para cada hipótese diagnóstica.
Para especialistas em medicina fetal e genética clínica, isso pode significar diagnósticos mais rápidos, melhor aconselhamento familiar e decisões terapêuticas mais precoces em uma fase crítica do desenvolvimento humano.
Como concluem os autores, o futuro da inteligência artificial na genômica não está em substituir o julgamento médico, mas em construir um fluxo de trabalho em que algoritmos, bases de dados e especialistas humanos trabalhem juntos para transformar uma avalanche de dados genéticos em diagnósticos clinicamente úteis.
Referência
DeepBD: Um fluxo de trabalho baseado em agentes para priorização de variantes e diagnóstico de defeitos congênitos genéticos. Shiyu Li , Ziqi Yan , Zhihao Wu , Jielong Lu , Weiran Liao , Jiajun Yu , Genjie Li , Zeyu Chu , Jiajun Bu , Haishuai Wang.
https://doi.org/10.48550/arXiv.2606.24779